Suchen in Texten

ثبت نشده
چکیده

• Ein Alphabet ist eine endliche Menge von Symbolen. • Wörterüber Σ sind endliche Folgen von Symbolen aus Σ. Wörter werden manchmal 0 und manchmal von 1 an indiziert, d.h. w = w 0 · · · w n−1 bzw. w = w 1 · · · w n , je nachdem, was im Kontext praktischer ist. Bsp.: Σ = {a, b}, dann ist w = abba ein Wortüber Σ. • Die Länge eines Wortes w wird mit |w| bezeichnet und entspricht der Anzahl der Symbole in w. • Das Wort der Länge 0 heißt leeres Wort und wird mit ε bezeichnet. • Die Menge aller Wörterüber Σ wird mit Σ * bezeichnet. Die Menge aller Wörter der Länge größer gleich 1 ¨ uber Σ wird mit Σ + := Σ * \{ε} bezeichnet. Die Menge aller Wörterüber Σ der Länge k wird mit Σ k ⊆ Σ * bezeichnet.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Inhaltsorientierte Navigation in automatisch generierten Hypertext-Basen

Der automatische Aufbau von Hypertexten aus Kollektionen linearer Texte erfordert Verfahren zur Analyse und Segmentierung von Texten, sowie zur Generierung von Hypertext-Kanten. In diesem Beitrag werden Theorien zur Beschreibung der thematischen Struktur von Texten aufgegriffen und zur Entwicklung von Kriterien genutzt, die es erlauben, inhaltlich begründete Kanten zwischen Textfragmenten zu er...

متن کامل

Salton und Wittgenstein in den Humanities: Über die Semantik in Philosophischen Texten

In der Informatik wird die Semantik durch diskriminierende Terme beschrieben. Jedoch fehlen oftmals speziell in philosophischen Texten genau diese gewichtigen Terme. Ausgehend von der oft eingesetzten diskriminierenden Semantik wird am Problem der Sinnund Weisheitssprüche eine kontrastive Semantik vorgestellt. Die eingeführte Methode stellt ein Lessons Learnt aus dem eAQUA-Projekt [BHG08, HBB10...

متن کامل

Technologien zur Wiederverwendung von Texten aus dem Web

Texte aus dem Web können einzeln oder in großen Mengen wiederverwendet werden. Ersteres wird Textwiederverwendung und letzteres Sprachwiederverwendung genannt. Zunächst geben wir einen Überblick darüber, auf welche Weise Text und Sprache wiederverwendet und wie Technologien des Information Retrieval in diesem Zusammenhang angewendet werden können. In der übrigen Arbeit werden dann eine Reihe sp...

متن کامل

Räumliche Suchen im Wandel

Google hat mit seiner Suche im Internet neue Maßstäbe gesetzt. Dies bekommt zunehmend auch die Geoinformatik zu spüren. Internetnutzer und somit auch die Nutzer von Geoportalen, Web-GIS-Anwendungen oder sonstigen webgestützten räumlichen Informationssystemen geben sich heute nicht mehr mit langsamen, mehrstufigen Suchen zufrieden, die erst ein Ergebnis liefern, nachdem man den „Suchen-Button“ g...

متن کامل

Evaluation der Qualität lexikalischer Ressourcen zur Stimmungserkennung in literarischen Texten

In dieser Veröffentlichung wird die Qualität bzw. Effektivität von lexikalischen Ressourcen zur automatischen Stimmungserkennung in literarischen Texten evaluiert. Dazu werden die drei unterschiedlichen Wortlisten Sentiment Phrase List (SePL), NRC Emotion Lexicon und SentimentWortschatz (SentiWS) sowie ein manuell klassifiziertes Referenzset verwendet. Der Testkorpus besteht aus 20 ausgewählten...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2006